Common Voice优化

# Common Voice优化

Distil Whisper Large V3 Ptbr

这是distil-whisper-large-v3的微调版本，专门用于巴西葡萄牙语的自动语音识别（ASR），结合了Common Voice 16数据集和私有数据集进行训练。

Whisper Medium Portuguese

基于openai/whisper-medium在common_voice_11_0数据集上微调的葡萄牙语语音识别模型，词错误率6.5987

Transformers 其他

Wav2vec2 Large Xlsr 53 German With Lm

这是一个基于XLSR Wav2Vec2架构的德语自动语音识别模型，带有语言模型支持，在Common Voice德语数据集上表现出色。

Transformers 德语

W2v Hf Commonvoice From Xlsr53 Pretrain 0329UTC1500

基于facebook/wav2vec2-large-xlsr-53在Common Voice日语数据集上微调的语音识别模型

基于西班牙语Common Voice数据集微调的语音识别模型，采用facebook/wav2vec2-xls-r-300m架构，在测试集上WER达到14.6%

Transformers 西班牙语

Wav2vec2 Xls R 300m Hy

基于facebook/wav2vec2-xls-r-300m模型在亚美尼亚语数据集上微调的自动语音识别(ASR)模型，支持亚美尼亚语语音转文字任务。

Transformers 其他

Wav2vec2 Base Turkish

该模型是基于Common Voice土耳其语数据集微调的Wav2Vec2语音识别模型，在土耳其语自动语音识别任务上表现优异。

Transformers 其他

Wav2vec2 Large Xlsr 53 French

这是一个基于XLSR-53大模型微调的法语语音识别模型，在Common Voice数据集上训练，支持高准确率的法语语音转文本。

语音识别法语

Wav2vec2 Large Xlsr 53 Spanish With Lm

这是一个基于Wav2Vec2-Large-XLSR-53的西班牙语语音识别模型，增加了语言模型支持，显著提升了识别准确率。

语音识别西班牙语

patrickvonplaten

Xls R Spanish Test

这是一个基于facebook/wav2vec2-large-xlsr-53模型在西班牙语Common Voice 7数据集上微调的自动语音识别(ASR)模型。

Transformers 西班牙语

Wav2vec2 Xls R 300m Cv8 Turkish

基于facebook/wav2vec2-xls-r-300m微调的土耳其语自动语音识别模型，在Common Voice 8.0 TR数据集上训练

Transformers 其他

Wav2vec2 Large Fr Voxpopuli French

基于facebook/wav2vec2-large-fr-voxpopuli微调的法语语音识别模型，在Common Voice 6.1法语数据集上训练，支持16kHz音频输入

语音识别法语

Wav2vec2 Large Xlsr 53 Persian

针对波斯语优化的XLSR-53大模型语音识别系统，基于facebook/wav2vec2-large-xlsr-53架构微调

语音识别其他

Wav2vec2 Large Xlsr 53 Punjabi

这是一个基于Harveenchadha/vakyansh-wav2vec2-punjabi-pam-10在Common Voice数据集上微调的旁遮普语自动语音识别模型

Transformers 其他

Xlsr Kurmanji Kurdish

该模型是基于facebook/wav2vec2-xls-r-300m在库尔曼吉库尔德语数据集上微调的自动语音识别模型。

Transformers 其他

Wav2vec2 Large Xlsr 53 French Punctuation

基于wav2vec2-large-xlsr-53架构的法语自动语音识别模型，支持标点符号预测

语音识别法语

Wav2vec2 Xls R Sl A2

这是一个基于facebook/wav2vec2-xls-r-300m模型在斯洛文尼亚语(MOZILLA-FOUNDATION/COMMON_VOICE_8_0 - SL)数据集上微调的自动语音识别模型。

Transformers 其他

Wav2vec2 Large Xls R 300m Bashkir Cv7 Opt

这是一个基于Facebook的wav2vec2-xls-r-300m模型在巴什基尔语Common Voice 7数据集上微调的自动语音识别模型。

Transformers 其他

Central Kurdish Xlsr

这是一个基于facebook/wav2vec2-xls-r-300m模型在库尔德语中部方言上微调的自动语音识别模型，在Common Voice 8.0数据集上训练。

Transformers 其他

Hindi Base Wav2vec2

这是一个基于wav2vec2架构的印地语自动语音识别(ASR)模型，在Common Voice等数据集上进行了训练。

Transformers 其他

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24